抽样分布 – 是什么?
作者:Ruben Geert van den Berg,归类于 统计 A-Z
抽样分布(Sampling Distribution)是指从一个总体(Population)中抽取多个随机样本(Random Sample),并计算每个样本的某个统计量(Statistic),然后将这些统计量的频率分布(Frequency Distribution)展示出来。抽样分布是 推论统计 的核心概念,但大多数标准教科书对此解释不足。理解这个概念可能需要一些时间,但一旦理解,你就会真正理解常见的统计过程,如 ANOVA(方差分析) 或 卡方检验。
抽样分布 - 示例
假设有一个岛屿,有976位居民。政府掌握了整个总体的数据,包括人们结婚的次数。下面的截图显示了这些数据的一部分。
总体分布(Population Distribution)- 结婚次数
许多居民从未结婚(或者尚未结婚),在这种情况下,结婚次数为零。其他居民结婚、离婚并再婚,有时多次。下面的直方图显示了我们976位居民的结婚次数分布。
请注意,总体分布是强烈 偏斜 的(不对称的),这对于这些数据来说是有道理的。平均而言,人们结婚约1.1次,如下面的一些描述性统计所示。
这些描述性统计再次强调了总体分布的高度偏斜性;偏斜度约为1.8,而对称分布的偏斜度为零。
抽样分布 - 是什么以及为什么
政府掌握这些确切的总体数据。然而,一位社会科学家无法访问这些数据。因此,尽管政府知道,我们的科学家却不知道岛屿居民结婚的频率。理论上,他可以询问所有976人,从而找到结婚次数的精确总体分布。由于这太耗时,他决定抽取一个n = 10人的简单随机样本(Simple Random Sample)。
平均而言,这10位受访者结婚1.1次。那么,这说明了976人的整个总体的情况?我们不能断定他们平均结婚1.1次,因为第二个n = 10的样本可能会得出(略微)不同的平均结婚次数。
这基本上是推论统计中的基本问题:样本统计量(Sample Statistic)在(假设的)样本中会发生变化。解决这个问题的方法是弄清楚它们变化_多少_。这样,我们至少可以估计一个可能的范围 - 称为 置信区间 - 用于总体参数(Population Parameter),例如平均结婚次数。
抽样分布 - 模拟研究
如果我们从岛屿总体中重复抽取10位受访者的样本,那么平均结婚次数在这些样本中的变化会有多大?这里的一种方法是计算机模拟(下面的模拟是用 SPSS 完成的)。
我们实际上从976位居民的总体数据中抽取了1,000个n = 10的样本。然后,我们计算了每个样本中的平均结婚次数。结果的直方图可视化了抽样分布:一个样本统计量在许多重复样本中的分布。
抽样分布 - 中心极限定理(Central Limit Theorem)
我们模拟的结果显示了一个非常有趣的现象:样本均值的抽样分布与976位居民的结婚次数的总体分布非常不同:抽样分布的偏斜程度要小得多(或更对称)且更平滑。
事实上,对于合理的样本量,比如n > 30,均值和总和总是(近似) 正态分布。这并不取决于数据值可能遵循的任何总体分布。但是,这确实需要独立且同分布的变量,这是大多数应用统计的常见假设。这种现象被称为 中心极限定理。
请注意,即使对于1,000个n = 10的样本,我们的均值抽样分布也已经看起来有些类似于下面的正态分布。
标准正态分布(Standard Normal Distribution)
常见的抽样分布
你在实践中最常遇到的抽样分布都源于中心极限定理所暗示的正态分布。这适用于:
- 样本均值、总和、百分比和比例的正态分布;
- t检验 中样本均值和 回归分析 中 beta系数 的t分布;
- 方差的卡方分布;
- ANOVA(方差分析) 中方差比的F分布。
方差的抽样分布近似于卡方分布,而不是正态分布。
抽样分布 - 重要性
抽样分布告诉我们哪些结果是可能的,假设我们的研究假设成立。因此,也许我们的假设是硬币是平衡的:正面和反面在抛掷后都有50%的机会朝上。该假设暗示了下面所示的由10次抛硬币产生的正面朝上的数量的抽样分布。
这告诉我们,在1,000个这样的10次抛硬币的随机样本中,大约有10个样本(1%)应该导致0或1个正面朝上。因此,我们认为0或1个正面朝上是不太可能的结果。如果无论如何都发生了这样的结果,那么也许硬币根本就不平衡。我们拒绝正面和反面机会相等的假设,并得出结论,正面朝上的可能性低于50%。